剑指 Offer 41. 数据流中的中位数

题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

  • void addNum(int num) - 从数据流中添加一个整数到数据结构中。
  • double findMedian() - 返回目前所有元素的中位数。

示例 1:

1
2
3
4
输入:
["MedianFinder","addNum","addNum","findMedian","addNum","findMedian"]
[[],[1],[2],[],[3],[]]
输出:[null,null,null,1.50000,null,2.00000]

示例 2:

1
2
3
4
输入:
["MedianFinder","addNum","findMedian","addNum","findMedian"]
[[],[2],[],[3],[]]
输出:[null,null,2.00000,null,2.50000]

限制:

  • 最多会对 $addNum、findMedian$ 进行 $50000$ 次调用。

注意:本题与主站 295 题相同:https://leetcode-cn.com/problems/find-median-from-data-stream/


算法

(对顶堆) $O(n)$

小根堆 + 大根堆 结构来维护中位数,大根堆存储比较小的一部分数,小根堆存储比较大的一部分数。
需要维护结构中小根堆的元素个数最多比大根堆元素个数多 $1$。
如果数的个数是奇数,中位数就是小根堆堆顶,如果是偶数,中位数就是小根堆堆顶和大根堆堆顶之和 / 2。

代码实现技巧:每次先把元素添加到小根堆中,如果小根堆堆顶比大根堆堆顶大,构成逆序就需要交换,且要保证小根堆的元素个数最多比大根堆元素个数多 $1$,超过 $1$ 则需要将其堆顶弹出并插入到大根堆中。

时间复杂度

每次往堆中插入元素的时间复杂度为 $O(1)$,求中位数的时间也是 $O(1)$,所以总时间复杂度为 $O(n)$

空间复杂度

$O(n)$

C++ 代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
class MedianFinder {
public:
priority_queue<int> max_heap;
priority_queue<int, vector<int>, greater<int>> min_heap;

/** initialize your data structure here. */
MedianFinder() {

}

void addNum(int num) {
min_heap.push(num);
if (min_heap.size() > max_heap.size() + 1) {
max_heap.push(min_heap.top());
min_heap.pop();
}
if (max_heap.size() && min_heap.top() < max_heap.top()) {
int minv = min_heap.top(), maxv = max_heap.top();
min_heap.push(maxv), max_heap.push(minv);
min_heap.pop(), max_heap.pop();
}
}

double findMedian() {
if ((min_heap.size() + max_heap.size()) & 1) return min_heap.top();
return (min_heap.top() + max_heap.top()) / 2.0;
}
};

/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/
Author: tonngw
Link: https://tonngw.com/2022/07/08/剑指 Offer/剑指 Offer 41. 数据流中的中位数/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.